В области исследований мультироботизированных систем контроль окружения является важной темой. Он широко используется как в гражданской, так и в военной областях, включая скоординированное сопровождение, захват целей противника, разведку и наблюдение, патрулирование беспилотных надводных кораблей и охоту.
Основная проблема в этих приложениях заключается в том, как управлять мультироботизированными системами, связанными с многоцелевым распределением, одновременно решая проблемы окружения целей и предотвращения столкновений. Это создает серьезные проблемы, особенно для децентрализованных мультироботизированных систем.
Команда профессора Пу Чжицяна из Института автоматизации Китайской академии наук представила документ на конференции ICRA 2022. Они предложили метод глубокого интенсивного обучения, основанный на реляционной диаграмме, который демонстрирует хорошую адаптивность к проблемам многоцелевого окружения от столкновений (MECA) в различных условиях.
ieeexplore
Выражение вопроса
Исследование назначило миссию MECA, в которой среда с L статическими препятствиями (черными кругами) включает в себя мультироботизированную систему, состоящую из N роботов (зеленых кругов). Цель состоит в том, чтобы совместно окружить K (1 < K < N) неподвижную или движущуюся цель (красный круг).
Все роботы должны самостоятельно формировать несколько групп, чтобы окружить все цели. Каждая группа должна формировать круговую группу, чтобы окружить одну цель, избегая при этом столкновения. Это предполагает решение следующих трех подтем:
1) Динамическое многоцелевое распределение и группировки
2) Каждая группа окружает цель
3) Предотвращение столкновений между группами
Диаграмма MECA для децентрализованной многороботизированной системы
Методы
В контексте проблемы MECA существует три типа объектов: роботы, цели и препятствия. Отношения столкновений между различными объектами и роботами различны, например, избегание препятствий, окружение цели и сотрудничество с другими роботами.
В исследовании предлагается децентрализованный метод глубокого интенсивного обучения (DRL), основанный на диаграмме отношений уровня робота и уровня цели (RG), известный как метод MECA - DRL - RG.
Четко:
Моделирование и обучение RG роботизированного класса с использованием графической сети внимания (GATS). Эти RG состоят из трех изомерных диаграмм отношений между каждым роботом и другими роботами, целями и препятствиями.
Используйте GAT для построения RG целевого уровня и захвата пространственных отношений между роботом и различными целями. Целевое движение моделируется целевым классом RG и предсказывает траекторию цели, контролируя обучение.
Кроме того, определена сложная функция вознаграждения, встроенная в знание для решения многоцелевых задач в MECA. Алгоритм обучения Actor - Critic, основанный на централизованном обучении и децентрализованном исполнении, используется для обучения стратегических сетей.
Общая структура MECA - DRL - RG
Эксперимент
Команда провела симуляционные эксперименты и эксперименты в реальных условиях. В реальных экспериментах сценарий был следующим: шесть роботов окружили две движущиеся цели в среде с двумя препятствиями. Данные о местоположении и скорости робота регистрируются системой захвата движения NOKOV.
Шесть роботов окружили две цели в двух обстановках
Как симуляционные, так и реальные эксперименты подтвердили, что метод MECA - DRL - RG позволяет роботам изучать изомерные карты пространственных отношений из окружающей среды по сравнению с другими методами. Это позволяет им прогнозировать траекторию цели, тем самым улучшая понимание и прогнозирование окружения каждого робота. Была подтверждена эффективность метода MECA - DRL - RG.
Кроме того, независимо от увеличения числа роботов, препятствий или целей или ускорения движения цели, метод MECA - DRL - RG продемонстрировал отличную производительность и широкую адаптацию.
Тренировочная кривая MECA - DRL - RG
Ссылки:
Пожалуйста, свяжитесь с нами
-
Мы прилагаем все усилия для того, чтобы помочь вам в ваших запросах и предоставить полную информацию.
Поделитесь с нами своими проблемами, и мы быстро направим вас к наиболее эффективному решению.
-
-
- Объем захвата * m m m
-
Объекты для отслеживания *
- Количество целей (необязательно)
-
Тип камеры (по желанию)
-
Количество камер (необязательно)
- Отправить